期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 利用URL-Key领域术语识别方法
吕书宁, 董志安
北京大学学报(自然科学版)    2018, 54 (2): 262-270.   DOI: 10.13209/j.0479-8023.2017.157
摘要1168)   HTML3)    PDF(pc) (451KB)(238)    收藏

首次提出利用URL-Key进行领域术语识别的方法。以URL作为媒介, 借助已知URL-Key的领域性来判断未知领域候选术语的领域性。首先, 借助互联网中已有的人工分类领域URL, 根据URL-Key在各领域汇总使用的频度, 采用基于方差的领域URL-Key识别方法, 构建领域URL-Key词表; 然后, 利用伪反馈技术, 收集候选领域词检索得到的URL结果集, 根据URL结果集构建候选领域术语的URL-Key特征向量; 最后, 利用SVM对候选领域术语进行提取。在4个领域进行实验, 都取得不错的效果。新提出的方法可以有效地解决低频术语识别问题, 为低频术语的识别提供新的思路。

相关文章 | 多维度评价 | 评论0
2. 利用URL-Key进行查询分类
李雪伟,吕学强,董志安,刘克会
北京大学学报(自然科学版)